专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果3998个,建议您升级VIP下载更多相关专利
  • [发明专利]多中心综合网络爬虫系统-CN202010206809.5有效
  • 闫长江 - 新华智云科技有限公司
  • 2020-03-23 - 2023-09-01 - G06F16/951
  • 本发明公开了一种多中心综合网络爬虫系统,包括:爬虫中心和若干不同特色业务中心;若干不同特色业务中心分别处理不同的特色业务;爬虫中心用于对爬虫进行集中管理为不同特色业务中心服务;爬虫中心包括:爬虫池、爬虫执行缓存池、爬虫持久化数据库、爬虫维护API、爬虫执行器和爬虫组。本发明的有益之处在于,用户覆盖面广,爬虫的利用率及效益高。
  • 中心综合网络爬虫系统
  • [发明专利]一种通过爬虫状态机管理爬虫的方法及装置-CN201711105662.5在审
  • 郭建辉 - 天脉聚源(北京)传媒科技有限公司
  • 2017-11-10 - 2018-04-20 - G06F17/30
  • 本发明公开了一种通过爬虫状态机管理爬虫的方法及装置。所述通过爬虫状态机管理爬虫的方法,包括根据预设的爬虫规则生成爬虫状态机;将爬虫工作分解为多个阶段;运行所述各个阶段的爬虫工作对应的爬虫任务;在当前阶段的爬虫任务结束后,更新所述爬虫状态机的当前阶段的状态;在所述爬虫状态机的当前阶段满足预设的完成条件时,运行下一个阶段的爬虫工作对应的爬虫任务。本发明使得用户可直观的观测到爬虫的运行情况,也方便了相关的技术人员针对性的调整爬虫策略,从而提升了用户和技术人员的使用体验。
  • 一种通过爬虫状态机管理方法装置
  • [发明专利]基于人工智能的网络爬虫方法、装置、设备及介质-CN202210035717.4在审
  • 黄日华 - 平安科技(深圳)有限公司
  • 2022-01-13 - 2022-04-22 - G06F16/951
  • 本申请提出一种基于人工智能的网络爬虫方法、装置、电子设备及存储介质,基于人工智能的网络爬虫方法包括:基于智能搜索引擎配置爬虫参数,所述爬虫参数包括需要被抓取的目标网址和网页中的目标字段;基于所述爬虫参数和预设的爬虫模板生成第一爬虫程序;依据机器学习算法优化所述第一爬虫程序以生成第二爬虫程序;依据预设的爬虫指标确定所述第二爬虫程序的爬取深度以获取第三爬虫程序;基于所述第三爬虫程序进行数据爬取以获取爬虫日志。本申请可以在保证爬虫数据准确性的情况下确定爬虫程序的爬取深度,从而提高数据的爬取效率。
  • 基于人工智能网络爬虫方法装置设备介质
  • [发明专利]一种分布式动态可配置的爬虫平台及爬虫方法-CN202111348896.9在审
  • 朱遥文;黄伟聪 - 北京众标智能科技有限公司
  • 2021-11-15 - 2022-04-08 - G06F16/951
  • 本发明提供了一种分布式动态可配置的爬虫平台及爬虫方法,用于从海量站点内定向抓取数据,包括用户输入爬虫需求,依据爬虫需求形成爬虫抓取规则;解析爬虫抓取规则形成爬虫任务,解析爬虫调度配置形成爬虫任务调度;根据爬虫任务对爬虫平台内多个爬虫子模块排序,选择排序最高的爬虫子模块作为最优爬虫运行节点;启动并执行爬虫任务,分别抓取m个目标站点的n个指定页面,解析指定页面URL并去重处理后加入待爬列队,直至m个目标站点中n个指定页面全部被抓取;对待爬列队中指定页面的结构化数据相似度检测,去重处理以降低冗余度,形成并保存爬虫结果。爬虫方法能够从海量站点内定向抓取数据,以快速高效的获取用户所需数据。
  • 一种分布式动态配置爬虫平台方法
  • [发明专利]一种数据抓取策略的确定方法、装置及设备-CN202210981063.4在审
  • 武寨青;程国艮;李欣杰 - 中译语通科技股份有限公司
  • 2022-08-16 - 2022-11-08 - G06F16/951
  • 本申请提供了一种数据抓取策略的确定方法、装置及设备,其中,该方法包括:针对每个爬虫测试程序,从该爬虫测试程序中抽取该爬虫测试程序对应的爬虫行为特征,并确定该爬虫测试程序对应的测试爬取目标针对该爬虫测试程序的反馈结果;根据所有爬虫测试程序对应的爬虫行为特征以及反馈结果,确定爬虫测试模型;将针对爬取目标的候选爬虫策略所对应的至少一个爬虫行为特征输入爬虫测试模型,获得爬取目标针对候选爬虫策略的预测反馈结果;根据预测反馈结果对候选爬虫策略进行调整达到有针对性的设计爬取策略,避免爬虫资源的浪费,并能够持续、稳定地进行数据抓取的效果。
  • 一种数据抓取策略确定方法装置设备
  • [发明专利]检测反爬虫策略安全性的方法及装置-CN201610537443.3有效
  • 崔广宇;李巍 - 携程计算机技术(上海)有限公司
  • 2016-07-08 - 2019-05-21 - H04L29/06
  • 本发明公开了一种检测反爬虫策略安全性的方法及装置,其中,所述方法包括:在网站的第一前端页面中嵌入用于实现反爬虫策略的反爬虫代码;利用所述反爬虫代码检测访问所述第一前端页面的用户是否为爬虫,将被检测出是爬虫的用户记为目标对象;验证所述目标对象是否为爬虫,统计所述目标对象非爬虫的次数;根据所述次数计算所述反爬虫策略的误伤率,所述误伤率用于衡量所述反爬虫策略的安全性。本发明弥补了现有技术对反爬虫策略的安全性检测不当造成系统伤害的不足,能够对反爬虫策略安全性准确检测,便于及时对反爬虫策略进行修改或更新,避免由于反爬虫策略的安全性对线上系统的稳定性造成影响,在检测爬虫的同时保证系统的稳定性
  • 检测爬虫策略安全性方法装置
  • [发明专利]视频业务处理方法、装置及电子设备-CN201910241011.1有效
  • 张家斌;张婷;栗阳力;纪军 - 北京市博汇科技股份有限公司
  • 2019-03-27 - 2021-06-08 - H04N21/442
  • 方法包括:基于预设的视频业务获取与所述视频业务对应的爬虫任务集及配置文件;基于所述配置文件为所述爬虫任务集中的爬虫任务分配账号和进程,所述配置文件记录所述爬虫任务集中的每个爬虫任务对应的账号和进程,其中,所述爬虫任务集中的不同的第一爬虫任务对应的第一账号不相同,所述第一爬虫任务为需要重复登录账号的任务,每个所述第一账号与一个爬虫任务对应,且与所述第一账号对应的爬虫任务为所述第一爬虫任务;根据为所述爬虫任务集中的爬虫任务分配的账号和进程执行所述爬虫任务集中的爬虫任务
  • 视频业务处理方法装置电子设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top